Home

Home

11.3 상상 속에서의 학습: The Dreamer Architectures

Home / 인공지능 (Artificial Intelligence, AI) / 제목: Embodied AI & Modern Control / Chapter 11. 세계 모델과 모델 기반 강화학습 (World Models & Model-Based RL) / 11.3 상상 속에서의 학습: The Dreamer Architectures

11.3 상상 속에서의 학습: The Dreamer Architectures

11.3 상상 속에서의 학습: The Dreamer Architectures
11.3.1 DreamerV1: 잠재 공간에서의 가치 함수 학습과 정책 최적화
11.3.2 DreamerV2: 이산적 잠재 변수(Discrete Latent Variables)를 통한 장기 예측 안정화
11.3.3 DreamerV3: 스케일링을 위한 Symlog 변환과 하이퍼파라미터 튜닝의 자동화
11.3.4 DayDreamer: 물리 로봇을 위한 실시간 온라인 학습 및 배포 전략

Generated by Rust Site Gen